
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。
大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。
OpenAI o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在大模型领域重现了当年 AlphaGo 强化学习的成功 —— 给越多算力,就输出越多智能,一直到超越人类水平。
我去,OpenAI CEO奥特曼的亲妹妹,一纸状书,把她亲哥给告了! 想不到让奥特曼再次陷入舆论危机的矛头,这次居然来自家庭内部,来自小他9岁的妹妹安妮·奥特曼(Annie Altman)。
OpenAI o1和o3模型的发布证明了强化学习能够让大模型拥有像人一样的快速迭代试错、深度思考的高阶推理能力,在基于模仿学习的Scaling Law逐渐受到质疑的今天,基于探索的强化学习有望带来新的Scaling Law。
刚刚,OpenAI 的 CEO Sam Altman 发布了自己的年终总结!!
OpenAI o1和o3模型的秘密,竟传出被中国研究者「破解」?今天,复旦等机构的这篇论文引起了AI社区的强烈反响,他们从强化学习的角度,分析了实现o1的路线图,并总结了现有的「开源版o1」。
近日,Steve Sokolowski公布了首个由OpenAI o1 pro指导的诉讼,包含工作流、提示词、法庭模拟等诸多细节。由于九成净资产已被骗走,Steve已无力支付80万美元的相关起诉费用。他选择使用AI指导案件,成功打破法律的闭环,已做好法院开庭的准备,并表示对结果非常乐观。
在各大企业不断裁员的氛围中,旧金山科技公司Artisan却广告呼吁「停止雇佣人类」,AI智能体难道真的会代替人类吗?OpenAI CFO的言论也令人震惊:每月花2000刀,企业就可以少雇一个人了。
当你用正确的方式优化模型,给模型指明正确的方向,无论什么问题,它们都会倾尽全力去学习,去解决问题。如果你的愿景足够吸引人,如果你能创建一个人们愿意加入的公司,一个实践合理做法的组织,同时还能在生态系统中保持其地位,那么其他人会效仿你。尤其当你做得比他们更好时,他们会被迫改变行为,这种影响比你作为下属去和他们争论要更具说服力。
Anthropic 的崛起是2024年全球 AI 产业最受瞩目的现象之一,它是 OpenAI 强有力的挑战者,令很多厌倦了 OpenAI 式虚张声势和夸大其词的 AI 研究者和开发者耳目一新。